STATISTIQUE
Cours

6. Autres métodes permettant d'étudier la normalité d'une distribution

Les deux méthodes que nous avons décrites jusqu'à maintenant pour étudier la normalité d'une distribution (droite de Henri et et test du Khi deux) présentent chacune des inconvénients :

La droite de Henri ne permet pas de quantifier l'hypothèse d'ajustement (ou de non ajustement) avec une probabilité. L'information reste très qualitative.

Le test du Khi deux n'est pas très puissant (le risque d'accepter l'ajustement alors que la distribution ne suit pas une loi normale est élevé).

Les méthodes d'études de la normalité les plus utilisées actuellement, reposent sur l'analyse de paramètres caractéristiques de la forme de la distribution. Les deux paramètres principaux sont les suivants :

1) le coefficient d'asymétrie (« skewness » en anglais).

La valeur de ce coefficient noté b1 est donnée par la formule:

Dans le cas d'une distribution normale, ce coefficient est égal à 0. Il est positif si le mode de la distribution est supérieur à la moyenne et négatif dans le cas contraire.

La méthode statistique basée sur l'analyse de ce paramètre est connue sous le nom de méthode D'Agostino et permet de comparer la valeur de b1 avec la valeur 0 pour un risque donné (généralement 5%).

2) le coefficient d'aplatissement (« kurtosis » en anglais).

Il est donné par la formule :

La valeur de ce coefficient est égal à 3 si la distribution est normale, inférieur à 3 si la distribution est plus aplatie et supérieur à 3 si la distribution est moins aplatie.

Le test d'Agostino compare donc la valeur de b2 à la valeur 3 pour un risque donné.

La combinaison de l'analyse des deux paramètres b1 et b2 est connue sous le nom de test d'Agostino Omnibus. C'est un test puissant que l'on peut utiliser avec des échantillons relativement petits (n>20).

Les autres méthodes sont connues sous les noms de :

  • Test de Martinez-Iglewicz, basé sur la médiane et sur un estimateur de la dispersion.

  • Test de Kolmogorov-Smirnov, basé sur la différence maximale entre la distribution observée et la distribution calculée selon une loi normale cumulative. Ce test est moins puissant que les deux précédents mais connait encore une grande popularité.

    Il peut être utilisé pour comparer une distribution observée avec une distribution théorique autre que la loi Normale.

    Exemple : Résultat d'un test de dégustation de vins dans des verres plus ou moins foncés (extrait du livre Biométrie, Modélisation de phénomènes biologiques, R. Tomassone, C. Dervin, J.P. Masson, ed. .Masson 1993).

    (cf. Tableau 7)

    L'hypothèse H0 est : la distribution observée (F10) peut être ajustée par une loi théorique FH : ici la loi uniforme.

    Le nombre de personne dans l‘échantillon est trop faible pour effectuer un test du Khi deux.

    Les fréquences relatives sont exprimées sous forme cumulée.

    La plus grande différence entre la fréquence observée et la fréquence théorique est ici 0,5. La table de Kolmogorov nous montre que la probabilité que la différence soit supérieure à 0,5 est inférieure à 1% (la valeur observée 0,5 est supérieure, au risque 1%, à la valeur critique 0,489 lue dans la table ). On peut donc conclure que l'ajustement de la distribution par la loi uniforme n'est pas acceptable, au risque 1%. La couleur du verre aurait donc une influence sur la sensation gustative.

Tabeau 7
Tabeau 7
AccueilImprimerRéalisé avec SCENARI6. Autres méthodes permettant d'étudier la normalité d'une distribution (page Précédente)